AI资讯新闻榜单内容搜索-DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSeek
训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD

训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD

训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD

以DeepSeek R1为代表的一系列基于强化学习(RLVR)微调的工作,显著提升了大语言模型的推理能力。但在这股浪潮背后,强化微调的代价却高得惊人。

来自主题: AI技术研报
9589 点击    2026-02-10 14:19
ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

2025 年 1 月 20 日,DeepSeek 发布了推理大模型 DeepSeek-R1,在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。 研究者发现,在数学推理等具有明确答案的任务

来自主题: AI技术研报
6804 点击    2026-02-08 11:52
字节阿里DeepSeek决战春节:一场关乎14亿人的重磅AI大战

字节阿里DeepSeek决战春节:一场关乎14亿人的重磅AI大战

字节阿里DeepSeek决战春节:一场关乎14亿人的重磅AI大战

这个春节,中国 AI 迎来「决战时刻」。据《The Information》援引内部消息人士透露:字节或将祭出全模态三件套;阿里除了或将发布强大的全新旗舰模型 Qwen 3.5 外,也会让千问打通支付与电商,挑战豆包;DeepSeek V4 或将携最强代码能力突袭。这不仅是技术竞赛,更是对 14 亿用户生活入口与未来互联网秩序的终极争夺。

来自主题: AI资讯
8696 点击    2026-01-30 19:21
刚刚,DeepSeek又探索新架构了,开源OCR 2

刚刚,DeepSeek又探索新架构了,开源OCR 2

刚刚,DeepSeek又探索新架构了,开源OCR 2

嘿!刚刚,DeepSeek 又更新了!这次是更新了十月份推出的 DeepSeek-OCR 模型。刚刚发布的 DeepSeek-OCR 2 通过引入 DeepEncoder V2 架构,实现了视觉编码从「固定扫描」向「语义推理」的范式转变!

来自主题: AI资讯
9537 点击    2026-01-27 17:15
R1一周年,DeepSeek Model 1悄然现身

R1一周年,DeepSeek Model 1悄然现身

R1一周年,DeepSeek Model 1悄然现身

2025 年 1 月 20 日,DeepSeek(深度求索)正式发布了 DeepSeek-R1 模型,并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中,DeepSeek-R1 也是该平台上获赞最多的模型。

来自主题: AI资讯
10768 点击    2026-01-21 09:51
领英、猎聘们「抓」不到的 AI 天才,这个团队想用 AI「追猎」

领英、猎聘们「抓」不到的 AI 天才,这个团队想用 AI「追猎」

领英、猎聘们「抓」不到的 AI 天才,这个团队想用 AI「追猎」

当 DeepSeek 和 OpenAI 的核心突破者越来越年轻,传统的简历筛选正在失效。一位前阿里达摩院的研究员,试图用 Agent 编织一张能捕捉「下一个 Ilya」的网。

来自主题: AI资讯
8645 点击    2026-01-20 17:23
对话自变量王潜:错过图灵奖,要做具身界的 OpenAI

对话自变量王潜:错过图灵奖,要做具身界的 OpenAI

对话自变量王潜:错过图灵奖,要做具身界的 OpenAI

王潜说,DeepSeek 当然很伟大,但我们要干一个像 OpenAI 那样的公司。

来自主题: AI资讯
10735 点击    2026-01-19 16:44
DeepSeek连发两篇论文背后,原来藏着一场学术接力

DeepSeek连发两篇论文背后,原来藏着一场学术接力

DeepSeek连发两篇论文背后,原来藏着一场学术接力

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

来自主题: AI技术研报
10690 点击    2026-01-16 10:06